ExpLSA : utilisation d'informations syntaxico-sémantiques associées à LSA pour améliorer les méthodes de classification conceptuelle

نویسندگان

  • Nicolas Béchet
  • Mathieu Roche
  • Jacques Chauché
چکیده

Résumé. L’analyse sémantique latente (LSA Latent Semantic Analysis) est aujourd’hui utilisée dans de nombreux domaines comme la modélisation cognitive, les applications éducatives mais aussi pour la classification. L’approche présentée dans cet article consiste à ajouter des informations grammaticales à LSA. Différentes méthodes pour exploiter ces informations grammaticales sont étudiées dans le cadre d’une tâche de classification conceptuelle.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Corroboration de vues discordantes fondée sur la confiance∗

Résumé. Cet article traite de la corroboration d’informations, dans le contexte de vues exprimant des opinions sur des faits de façon éventuellement contradictoire. Il s’agit de prédire si un fait est vrai ou faux. Des méthodes d’agrégation simples comme le vote donnent déjà de bons résultats, mais nous présentons dans cet article des algorithmes qui tiennent compte de la confiance dans les vue...

متن کامل

Apprentissage actif pour l'annotation de documents

RÉSUMÉ. Dans le cadre du projet LegDoc au Centre Européen de Recherche de Xerox, nous avons développé des composants pour l’annotation sémantique de documents semi-structurés. Alors que certaines entités sémantiques ont une forme régulière et peuvent être facilement extraites, d’autres collections plus complexes et hétérogénes nous ont amenés à déployer des méthodes d’apprentissage automatique....

متن کامل

Exploitation des Liens Sémantiques pour l'Expansion de Requêtes dans un Système de Recherche d'Information

RÉSUMÉ: Dans cet article, nous proposons d’exploiter des liens sémantiques entre concepts pour améliorer la recherche d’information. Un thesaurus électronique de langue générale est utilisé pour la reformulation des requêtes utilisateurs en procédant par un processus d’"expansion prudente" en amont d’un moteur de recherche. Ce processus, transparent à l’utilisateur, exploite d’abord la notion d...

متن کامل

Modélisation basée sur ontologies pour développer des recommandations personnalisées dans les systèmes hypermédia adaptatives

RÉSUMÉ. Afin d’offrir à l’utilisateur des fonctionnalités personnalisées sans lui demander de construire son profil d’une manière explicite, les systèmes adaptatifs hypermédia utilisent d’habitude les informations sur la navigation accomplie par chaque utilisateur au sein du système. Cet article présente une manière innovante de suivre l’activité de l’utilisateur en termes de thèmes d’intérêt p...

متن کامل

New Word Vector Representation for Semantic Clustering

RÉSUMÉ. L’idée que nous défendons dans cet article est qu’il est possible d’obtenir des concepts sémantiques significatifs par des méthodes de classification automatique. Pour ce faire, nous commençons par proposer des mesures permettant de quantifier les relations sémantiques entre mots. Ensuite, nous utilisons les méthodes de classification non supervisée pour construire les concepts d’une ma...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008